목차
1장 데이터 분석 기초 (Data Analysis Fundamentals)
- 데이터 분석의 개념
- 데이터 분석과 통계학
- 데이터 분석과 데이터 과학
- 데이터 분석의 주요 목적과 활용 사례
- 데이터 분석 프로세스와 방법론
- 횡단면 데이터 분석 (상관관계 분석 기법)
- 시계열 데이터 분석
※ AI 기술과 데이터 분석의 융합 : 별도로 하지 않고 각 내용에 모두 포함
2장 데이터 수집과 적재 (Data Collection and Storing)
- 데이터 적재
- 로그 데이터 적재
- 데이터 트래킹
- 데이터 수집
- 데이터 엔트리
- 공공데이터
- API를 통한 데이터 수집
- 웹스크래핑 (크롤링)
3장 빅데이터 (Big Data)와 데이터 분석
- 빅데이터의 문제
- 대량 데이터로 분석하는 방법
- 대량 데이터의 문제(빅데이터의 문제)
- 빅데이터 시각화
- 실시간 데이터 분석
- 클라우드 기반 빅데이터 처리
4장 데이터 전처리 (Data Preprocessing)
- 정형데이터 비정형데이터
- 피봇
- 정렬과 랭킹
- 시리즈(컬럼) 데이터 처리
- 결측치 처리
- 이상치 처리
- 데이터 정규화와 표준화
- AI를 활용한 데이터 정제
5장 데이터 탐색 (EDA, Exploratory Data Analysis)
- 데이터 집계
- 기술 통계량 분석 (평균, 중앙값, 분산 등)
- 데이터 분포 확인 (히스토그램, 박스플롯)
- 상관관계 분석
- 드릴다운
- 그룹별 분석
- SQL을 이용한 데이터 집계
- 파이썬을 활용한 데이터 탐색
- 시각적 EDA 기법
- AI 기반 데이터 패턴 발견
- 이상치 및 특이점 탐지
- 자동화된 EDA 도구 활용 (Pandas Profiling, Sweetviz 등)
- 대화형 EDA 도구 소개
6장 데이터 시각화 (Data Visualization)
- Seaborn
- Plotly
- Streamlit과 다이나믹리포트
- AI 기반 시각화 추천
- 인터랙티브 대시보드 구축
- 자동화된 인사이트 생성
7장 통계적 추론을 이용한 결정 방법 (Statistical Decision Making)
- 통계적 추론을 하는 이유?
- A/B 테스트와 버킷테스트
- 가설 검정
- 신뢰구간과 신뢰도
- AI 기반 의사결정 지원
8장 가상 사례를 통한 연습 (Practice)
- ※사례를 만들어야 함. 사용할 데이터세트를 수집한 후에 결정
- 실제 비즈니스 케이스 스터디
- 엔드투엔드 데이터 분석 프로젝트
- 실습용 데이터세트 (Kaggle 오픈 데이터)
- 소매 판매 분석: Retail Sales Dataset
- 고객 행동 분석: E-Commerce Behavior Data
- 금융 데이터 분석: Financial Dataset
- 마케팅 캠페인 효과: Marketing Campaign
- 소셜 미디어 분석: Twitter Sentiment Analysis
- 의료 데이터 분석: Healthcare Dataset
- 부동산 시장 분석: House Sales in King County
- 인적 자원 분석: HR Analytics
- 공공 데이터 분석: US Census Demographic Data
- 시계열 데이터 분석: Superstore Sales Dataset
9장 AI 캔버스를 이용한 데이터 분석 (Data Analysis with AI)
- ChatGPT 캔버스를 이용한 데이터 분석
- Notebook LM 활용한 데이터 분석
- 클로드(Claude)를 활용한 데이터 분석
- Cursor와 VScode+Copilot 활용한 코드 작성
- AI 기반 데이터 분석 자동화
- 머신러닝 모델 선택과 최적화
10장 데이터 분석 프로젝트 실전 (Real-world Projects)
- 프로젝트 기획과 설계
- 데이터 파이프라인 구축
- 모델 개발과 배포
- 성능 평가와 모니터링
- AI 기반 자동화 시스템 구축
11장 미래의 데이터 분석 (Future of Data Analysis)
- AI 기술의 발전 방향
- 자동화된 데이터 분석의 미래
- 윤리적 고려사항
- 데이터 거버넌스
- 지속 가능한 데이터 분석